package org.ljk.study;

import net.sourceforge.tess4j.*;

import java.io.File;

/**
 * 这是一个图片识别的示例
 *
 * @author ljk
 * @since 2023/11/26 22:02
 */
public class TextRecognitionExample {
    public static void main(String[] args) {
//借鉴文档 https://blog.csdn.net/singwhatiwanna/article/details/109152977
        File imageFile = new File("C:\\Users\\leng\\Desktop\\R-C.png");

        /*
        * 实现的原理 是对 libtesseract411.dll 进行了jna的调用,这只是一个转接口
        * 提高输出质量 https://tesseract-ocr.github.io/tessdoc/ImproveQuality.html
        * */
        ITesseract instance = new Tesseract();
        try {
            // 设置训练数据文件夹路径
            //数据集路径取自 https://github.com/tesseract-ocr/tessdata
            instance.setDatapath("D:\\AProgramData\\tessdata");
            // 设置为中文简体
            instance.setLanguage("eng");

            String result = instance.doOCR(imageFile);
            System.out.println(result);
        } catch (TesseractException e) {
            System.err.println(e.getMessage());
        }
    }
}